Daj się złapać w sieć

Janusz Miroforidis, 15.08.2019

Jakie są najbardziej wartościowe informacje, przechowywane w systemach informatycznych firm? Według mnie są to nietrywialne związki pomiędzy obiektami. Związki, powiązania, które niełatwo dostrzec, a które właśnie dlatego mogą być wykorzystane do zyskania przewagi rynkowej. Podczas rozwiązywania problemów przydaje nam się wiedza encyklopedyczna (np. wartość przyspieszenia ziemskiego), ale równie przydatna jest wiedza o powiązaniach, występujących w dziedzinie, której rozwiązywany problem dotyczy. Dla przykładu, znajomość drugiej zasady dynamiki Newtona, która jest związkiem trzech wielkości: masy ciała; siły, jaka działa na to ciało; przyspieszenia, jakie uzyskuje to ciało pod wpływem działającej siły, pozwala opisać ruch ciała pod wpływem działającej na nie siły.

Poszukując nietrywialnych powiązań pomiędzy obiektami występującymi w biznesowej rzeczywistości, możemy formułować prawa, które rządzą ich zachowaniem (inaczej – tworzyć modele rzeczywistości). To przekłada się na wymierne korzyści. Aby te bardzo ogólne spostrzeżenia odrobinę uwiarygodnić, posłużę się dwoma prostymi przykładami.

Przykład 1. Handel elektroniczny.
Robiąc zakupy w Internecie zauważamy, że systemy informatyczne e-sklepów rekomendują nam produkty, które zakupili lub oglądali inni klienci. Sugestie te zależą od tego, jakim produktem jesteśmy zainteresowani oraz od historii naszych zakupów. W istocie, systemy rekomendujące dokonują analizy powiązań pomiędzy produktami oraz klientami. Zależnie od tego, jakimi danymi dysponuje e-sklep, rekomendacje mogą uwzględniać powiązania o bardzo odmiennych charakterystykach. Jeśli w systemie e-sklepu klienci mogą tworzyć recenzje i komentarze, dotyczące np. książek, to na podstawie analizy wpisów, można ustalić, czyje wpisy mi się podobają (dałem im przysłowiową „łapkę w górę”). To pozwala utworzyć powiązanie pomiędzy moją osobą, a osobą, której wpisy „polubiłem”. Może być ono wykorzystane do zasugerowania mi produktów kupionych przez osobę, której wpisy cenię. Jeżeli taki rekomendowany produkt kupię, to siła związku „JA-TAMTA OSOBA” może być w systemie informatycznym zwiększona. Jeśli w przyszłości nie będę lubił recenzji lub komentarzy tej osoby (świat się zmienia), to system dostrzeże tę zmianę, odpowiednio zmieni relację, wiążącą mnie z tą osobą i przestanie rekomendować mi pozycje, które ta osoba nabyła.

Przykład 2. Wyłudzenia pieniędzy.
Z doniesień prasowych wiadomo, że klienci wyłudzają pieniądze od firm ubezpieczeniowych. Firmy te potrafią budować wzorce powiązań pomiędzy obiektami lub zdarzeniami, których występowanie w bazie danych może świadczyć o próbie wyłudzenia odszkodowania. Wzorce takie mogą być naprawdę złożone. Do ich opisu trzeba używać rozbudowanych sieci powiązań między obiektami. Oczywiście wzorzec powiązań, który określa zachowania niepożądane dla firmy, musi być utworzony przez ekspertów na podstawie rzeczywistych zdarzeń lub na podstawie dostępnych w literaturze wzorców. W przypadku wyłudzeń podatku VAT, służby skarbowe dysponują wzorcami powiązań (pomiędzy podmiotami gospodarczymi), które wyłudzenia te charakteryzują (tzw. karuzele VAT). Może być wiele mechanizmów wyłudzeń. Odpowiednio skatalogowane wzorce wyłudzeń mogą być wykorzystane do wykrywania podmiotów, które wyłudzeń dokonują. Oczywiście nie każdy sygnał ostrzegawczy z sytemu wykrywania anomalii, opartego na analizie powiązań, świadczy o zjawisku wyłudzenia.

Podane wyżej przykłady są próbą spojrzenia na dane z punktu widzenia powiązań pomiędzy obiektami. Zależnie od dziedziny, informacje o powiązaniach mogą być mniej lub bardziej użyteczne. Śledztwa dziennikarskie bazują w dużej mierze na analizie sieci powiązań pomiędzy osobami, firmami, organizacjami. W przypadku niewielkich sieci powiązań, analizę można wykonać na podstawie odręcznie wykonanego rysunku, reprezentującego sieć powiązań (w filmach kryminalnych takie rysunki znajdują się na ścianach nad biurkami detektywów). Gdy sieć tworzą setki lub tysiące węzłów, a powiązań pomiędzy węzłami jest jeszcze więcej, efektywna analiza takiej sieci jest możliwa, ale tylko z wykorzystaniem odpowiednich narzędzi informatycznych, czyli grafowych baz danych. Wnioski, jakie na podstawie takiej analizy możemy wyciągnąć, mogą być bezcenne. Oczywiście w systemach ERP związki między obiektami są oddane. Jednak silniki baz danych, na których są one oparte nie pozwalają na efektywną analizę złożonych sieci powiązań. Taka analiza może być efektywnie wykonana w oparciu o grafową bazę danych, okresowo zasilaną danymi z systemu ERP. Dysponuje ona wieloma algorytmami teorii grafów, rozwiązującymi przeróżne problemy (np. zagadnienie znalezienia najkrótszej ścieżki pomiędzy dwoma węzłami grafu).

Podczas rozwiązywania problemów biznesowych starajmy się myśleć o powiązaniach pomiędzy obiektami. Szukajmy wzorców, które kodują pozytywne lub negatywne, z punktu widzenia działania naszej firmy, zjawiska. W szczególności nie bójmy się stawiać pytań, czy istnieją związki pomiędzy obiektami, które warto wykorzystać do budowania przewagi rynkowej.

Powrót